## [1] "Se obtienen 13810 listados y  132  variables después de limpieza, quitar NA's y creación de variables"

Se obtienen datos de 21,477 listados en la CDMX para enero 2020. Siguiendo a (Cai et al., 2019) se filtran los listados con al menos una opinión (comentario) en los últimos 6 meses garantizando que los listados estuvieran “activos” al momento del estudio. Además, se remueven todas las observaciones con valores de NA en alguna variable, resultando en 132 variables y 13,810 observaciones.


Datos

La fuente principal de datos provienen del sitio Inside Airbnb. Una organización independiente y no comercial de autodenominados “científicos de datos con interés social” que realiza periódicamente scraping de la plataforma para las principales ciudades del mundo y ofrece datos abiertos para academia y gobierno. Los datos para CDMX comienzan a estar disponibles a partir de marzo 2019. Esta fuente de datos ha sido utilizada en estudios previos como Cai et al. (2019), Chattopadhyay et al. (2019) y Llados-masllorens et al. (2020) y es actualmente la mejor fuente de datos abiertos para el estudio de esta plataforma.

Para los datos de Seguridad y Acceso a redes de transporte utilizamos los Datos Abiertos Ciudad de México para identificar la frecuencia y zonas de delitos de bajo impacto y robos, así como las zonas de acceso para transporte colectivo Metrobús y Metro para el periodo de estudio. Para elegir los 10 puntos de interés (PDI) nos basamos en Las atracciones más populares en Ciudad de México de acuerdo con la plataforma Trip Advisor. Esta fuente de datos es utilizada para el mismo propósito en Chen et al. (2017) y Guttentag et al. (2019).

Descripción de datos.
Variable Descripción Fuente / Proceso
Precio Precio por noche (se transforma a log para regresión) Inside Airbnb
Listado entero Variable dicotómica: 1 = toda la casa / apto., 0 = no toda la casa / apto. Inside Airbnb. Creada a partir del tipo de hapitación/casa
Huéspedes permitidos Número máximo de huéspedes permitidos Inside Airbnb
Habitaciones Número de habitaciones Inside Airbnb
Baños Número de baños completos y medios Inside Airbnb
Amenidades Índice aditivo: “Family Friendly” + “Business Ready” + Desayuno + Estacionamiento + Wi-Fi + CableTV + Piscina + Ascensor
+ Gimnasio + Portero + Lavadora + Licuadora + Calefacción + …
Inside Airbnb. Índice creado a partir de extracción de texto en descripción.
Política de reservación Índice aditivo: Flexibilidad de cancelación + Con noches mínimas + Tarifa de limpieza + Requerir que el huesped tenga documento verificado Inside Airbnb. Índice creado a partir de dummies de requerimientos.
Localización Distancia media (fórmula Haversine) al Punto de Interés (PDI) más cercano. Selección de 10 puntos más visitados de CDMX Tripadvisor para elección de PDI y Google Maps para datos geográficos.
Competencia Número de competidores con mismo número de habitaciones en una distancia de 400 m. (fórmula Haversine) Inside Airbnb. Cálculo a partir de ubicación de listado.
Delincuencia Número de Delitos de Bajo Impacto, Robos a casa habitación,
Robo con/sin violencia y Robos a transeúnte con/sin violencia
Portal de datos de la CDMX. Carpetas de investigación FGJ
Acceso transporte Número de accesos a estaciones de transporte colectivo Metrobús o Metro en colonia Portal de datos de la CDMX. Líneas y estaciones de Metrobús. Estaciones de Metro
Anfitrión profesional Anfitrión con más de dos listados registrados Inside Airbnb
Estatus Superhost Dummy de certificado Superhost otorgado por Airbnb Inside Airbnb
Promedio de calificación Clasificación global (promedio sobre 100) Inside Airbnb
Descripción Presentación del anfitrión (medido en caracteres) Inside Airbnb. Creado a partir de extensión de texto de descripción.
Antigüedad Tiempo transcurrido desde que el listado se registró en la plataforma (medido en días) Inside Airbnb. Diferencia entre fecha de registro y fecha de extracción.
Experiencia Tiempo transcurrido desde que el anfitrión se registró en la plataforma (medido en días) Inside Airbnb. Diferencia entre fecha de registro y fecha de extracción.
Número de comentarios Reviews realizadas por huéspedes Inside Airbnb
Sentimiento de comentarios Reviews positivas y negativas (análisis de sentimiento en reviews con diccionario propio. En proceso) Inside Airbnb. Creado a partir de análisis de texto para las Reviews.

Estadística descriptiva

La estadística descriptiva permite observar en primer lugar la alta proporción de anfitriones profesionales operando en la CDMX (41%). Destaca que este tipo de anfitriones tienen en promedio casi 12 listados registrados, lo que indica que son agentes que administran una cantidad considerable de inmuebles y con ello pueden obtener mayor información del mercado y fijar precios de manera más eficiente respecto a los anfitriones no profesionales.

También encontramos una diferencia significativa en los precios de Airbnb entre anfitriones no profesionales y profesionales, estos últimos cobran en promedio $237 pesos más al día, pero sus listados también muestran características más favorables en comparación con los ofrecidos por los no profesionales. En particular, los profesionales tienen listados generalmente más grandes (pueden acomodar a más personas: 1.91 respecto 1.72 de no profesionales), tienen baños y dormitorios adicionales, brindan más comodidades (25.89 respecto 24.04 de no profesionales).

La pruebas de igualdad en medias muestran que en la mayoría de características estos grupos son significativamente diferentes.

Estadística descriptiva de datos.
Variable Total / Promedio Profesionales No Profesionales t-test medias Min Máx
Listados 13,810 5,699 8,111 NA NA NA
41% 59%
Listados registrados 5.45 11.36 1.30 p-value 1 78
se 0.08 0.17 0.01 0.000
Precio 976.91 1,116.32 878.95 p-value 206 5809
se 6.81 12.15 7.65 0.000
Precio/ persona 318.67 342.08 302.22 p-value 12.875 5322
se 1.81 2.93 2.28 0.000
Listado (hab/casa) entero 0.58 0.58 0.59 p-value 0 1
se 0.00 0.01 0.01 0.191
Huéspedes permitidos 1.80 1.92 1.72 p-value 1 16
se 0.01 0.02 0.01 0.000
Habitaciones 1.49 1.53 1.47 p-value 1 50
se 0.01 0.02 0.01 0.001 Hotel
Baños 1.42 1.48 1.37 p-value 0.5 50
se 0.01 0.02 0.01 0.000 Hotel
Amenidades del listado 24.81 25.90 24.04 p-value 1 92
se 0.08 0.14 0.11 0.000
Flexible (1=flexible,0=estricto) 0.87 0.90 0.86 p-value 0 1
se 0.00 0.00 0.00 0.000
Distancia de PDI (100 metros) 25.83 24.09 27.05 p-value 0.191 232.031
se 0.20 0.31 0.26 0.000
Competencia 49.07 54.13 45.52 p-value 1 251
se 0.54 0.88 0.68 0.000    
Delincuencia 50.88 55.55 47.61 p-value 0 195
se 0.41 0.68 0.51 0.000    
Acceso transporte 1.97 2.24 1.79 p-value 0 21
se 0.03 0.06 0.04 0.000    
Superhost 0.47 0.54 0.42 p-value 0 1
se 0.00 0.01 0.01 0.000
Calificación (max 100) 95.66 94.98 96.15 p-value 20 100
se 0.05 0.07 0.06 0.000
Descripción anfitrión (caracteres) 192.48 244.66 155.82 p-value 0 5443
se 2.82 5.17 3.07 0.000
Antigüedad listado (días) 618.26 617.31 618.92 p-value 5 3499
se 4.18 6.79 5.29 0.849
Antigüedad anfitrión (días) 1,320.06 1,396.82 1,266.14 p-value 11 4007
se 6.15 9.83 7.80 0.000
Reviews totales 31.90 34.84 29.84 p-value 2 208
se 0.32 0.55 0.40 0.000
Reviews / mes 1.91 2.06 1.80 p-value 0.03 17.8
se 0.02 0.03 0.02 0.000
Reviews palabras positivas 128.01 136.09 122.32 p-value 0 1723
se 1.54 2.50 1.94 0.000    
Reviews palabras negativas 25.10 28.06 23.02 p-value 0 520
se 0.37 0.61 0.46 0.000    

Mapa Interactivo general

El siguiente mapa muestra los listados de la CDMX en Enero 2020 después de la limpieza de datos. Podemos acercarnos con el zoom a cada zona y dar clic en los listados para obtener más información.

La mapa muestra la cantidad de listados de Airbnb en enero de 2020 en la Ciudad de México por municipio. Observamos que la mayoría de los listados se concentran en 4 municipios: Cuauhtémoc, Miguel Hidalgo, Benito Juárez y Coyoacán. La preponderancia de la alcaldía Cuauhtémoc y Miguel Hidalgo se explican por abarcar la zona turística de la CDMX y 6 de los 10 Puntos de Interés de acuerdo con Trip Avisor

Mapa Interactivo por tipo de anfitrión

Se identifica a un anfitrión profesional como aquel con más de dos \(>2\) listados registrados activos (Cai et al., 2019). En algunos otros artículos como (Lladós-Masllorens et al., 2020) se considera profesional a cualquier anfitrión con más de un listado registrado \(>1\). No hay un consenso al respecto. Nos quedamos con el criterio más estricto de \(>2\) listados.

La hipótesis es que un anfitrión con más listados no es una persona que busque sólo un ingreso adicional rentando su propiedad, sino un agente profesional que considera su actividad en Airbnb como un negocio administrando múltiples propiedades y por tanto su fijación de precios está más informada.

El mapa a continuación muestra los listados profesionales y listados no profesionales.

Podemos acercarnos con el zoom a cada zona.

Análisis espacial

Mapas estático general y por tipo de anfitrión

Mapas con puntos de interés seleccionados y distribución de delitos

Mapa delitos. Distribución espacial agrupada

El mapa nos muestra la distribución espacial de los delitos seleccionados (Ver Tabla de variables). Podemos observar que una parte considerable de los delitos considerados se concentran en la misma zona de alta demanda de Airbnb: Las alcaldías Cuauhtémoc y Miguel Hidalgo. Se medirá el impacto que tiene el nivel de delincuencia en la zona sobre el precio.

Mapa listados y precio promedio nivel Alcaldía y Colonia

Mapa listados, acceso a rutas de transporte y delitos nivel colonia

El mapa nos muestra la distribución espacial de los delitos seleccionados (Ver Tabla de variables). Podemos observar que una parte considerable de los delitos considerados se concentran en la misma zona de alta demanda de Airbnb: Las alcaldías Cuauhtémoc y Miguel Hidalgo. Se medirá el impacto que tiene el nivel de delincuencia en la zona sobre el precio.

Listados por alcaldía

La figura ilustra lo encontrado en el mapa anterior y nos muestra a detalle el número de listados y la distribución de en las alcaldías.

Listados por tipo propiedad

Desagregando la oferta por alcaldía de acuerdo al tipo de listado podemos observar que los apartamentos y casas son las principales ofertas de listados en la CDMX. Esto habla más del entorno urbano de la CDMX donde este tipo de construcciones son las más comunes.

Análisis de reseñas Enero 2020 (Wordcloud)

El análisis de texto y sentimiento puede ilustrar los factores que influyen en la toma de decisiones del consumidor. Para Enero 2020 se cuentan con 508,870 reseñas completas para los listados utilizados en este estudio, después de remover stopwords en inglés y español y realizar un steaming para las palabras en inglés se cuenta con poco más de 19 millones de palabras para ser procesadas.

Wordcloud Estático

.

## png 
##   2

Las nubes de palabras muestran tendencias interesantes; La ubicación parece ser un elemento clave, ya que las palabras “place”, “ubicación”, “zona” se destacan de manera prominente en la nube de palabras. La gente parece enfatizar el aspecto de comodidad de su estadía, palabras como “stay”, “nice”, “comfortable” nos dicen que muchas personas resaltan la comodidad del listado. La palabra “Anfitrión/Host” también es frecuente; lo que indica el importante papel que desempeñan los anfitriones en la experiencia global de Airbnb.

Wordcloud Interactivo

.

Evolución de demanda (reviews como proxy)

Demanda (reseñas desde inicio de Airbnb en México)

La figura nos muestra que las reviews por día para listados únicos ha aumentado con los años. Podemos ver un aumento casi exponencial en el número de reviews en los últimos 8 años.( Tomando las reviews como proxy de la demanda sigueindo a Dudas et al. (2017) y Gunter et al.(2018)) . Esta tendencia se ve impactada por el inicio de la pandemia de Covid 19 con la suspensión del servicio que hubo el 14 de marzo de 2020.

Las siguientes figuras nos muestra el comportamiento de la demanda durante el periodo de la pandemia. Se puede apreciar la caída repentina de la demanda y la lenta recuperación del servicio.

Demanda 2019 - 2020 Impacto Covid-19 y recuperación

Estacionalidad de demanda y precios

Estacionalidad de demanda 2017, 2018, 2019 (reviews)

Las tres figuras anteriores nos muestra que la demanda de Airbnb ha mantenido un comportamiento estable durante los últimos 3 años previos al periodo de estudio: Enero 2020. Dentro de las limitaciones de la metodología, se puede mencionar que la metodología no es dinámica, solo utiliza datos transversales obtenidos en enero 2020, por tanto factores temporales como la estacionalidad (vacaciones, eventos y días dentro de una semana). De acuerdo con la evidencia preliminar, la demanda de Airbnb en la CDMX se mantiene estable durante el año, no se observa un aumento significativo en verano o fin de año, por lo que no se espera que efectos estacionales influyan significativamente en los resultados.

Estacionalidad de precios en todo el periodo

La figura contrasta con la figura anterior porque nos muestra que para final de año (a partir de octubre) se ve un aumento en la media de precios y se ajusta a la baja a partir de enero. Debido a que los precios se determinan ex-ante y se realizan ajustes conforme avanza el año se grafican los promedios de precios por noche al día. Esto significa que los anfitriones actualizan sus precios a la alza hacia finales de año previniendo una mayor demanda.

Podemos observar que los precios determinados ex-ante para 2020 no muestran el comportamiento ascendente que tuvieron en 2019. Esto es evidencia del efecto de la pandemia Covid-19. Los anfitriones ajustaron ex-ante sus precios a la baja para hacer frente a la caída de la demanda mostrada de la figura de la evolución de demanda.

DISCLAIMER SOBRE DATOS DE REVIEWS Y PRECIOS: Para la estimación de la demanda tomamos como proxy las reviews (se justifica el motivo en la sección de Estrategia Empírica). Con esto conocemos toda la demanda (reviews) anteriores al periodo de estudio. Así se pudo construir la evolución de la demanda desde 2012.

En cambio, para los precios tenemos disponible a partir desde marzo 2019 hasta enero 2021. Esta diferencia en la disponibilidad de datos es porque los precios disponibles en la base de datos son precios que los anfitriones determinan ex-ante para todo el año siguiente, y van haciendo ajustes a lo largo del año.

Estacionalidad de precios en semana

La figura nos muestra que en promedio los viernes y sábados son más caros en comparación con el resto de días de la semana. Es importante notar que este ajuste de precios en función del día de la semana es una función “avanzada” de la plataforma Airbnb donde el anfitrión debe configurar una regla para precios en función del día. Probablemente esta herramienta sea más utilizada por los anfitriones profesionales.

Gráficas descriptivas por tipo de anfitrión

Con base en los gráficos anteriores, podemos destacar:

  • Superhost: Los anfitriones con categoría Superhost son en mayor proporción anfitriones profesionales. Esto es esperado debido a que la categoría Superhost se obtiene con calificación general de 9.4 o más, completar al menos 10 estancias o 100 noches en al menos 3 estancias completadas durante el último año, índice de cancelación menor a 1% e índice de respuesta de 90%. Todos estos requisitos son congruentes con el perfil de anfitrión profesional.

  • Documentos verificados: En general menos del 50% de anfitriones cuenta con documentos verificados (foto e identificación oficial), sin embargo se observa que dentro de los anfitriones con documentos verificados, los profesionales tienen una mayor proporción.

Con base en los gráficos anteriores, podemos destacar:

  • Alcaldía: Como se mostró en la Figura por alcaldías, Cuauhtémoc concentra la mayoría de los listados, esta segunda gráfica nos permite ver que también tiene una mayor proporción de anfitriones profesionales. La única alcaldía con una mayor proporción de anfitriones no profesionales es Benito Juárez, la tercera con más listados.

  • Tipo de propiedad: Los apartamentos, condominios y casas conforman el grueso de las propiedades registradas. Esto habla más del entorno urbano de la CDMX donde este tipo de construcciones son las más comunes.

  • Tipo de habitación: Podemos observar que las habitaciones compartidas son casi inexistentes en el mercado de la CDMX (3% en total). Predominan los departamentos/casas enteras y las habitaciones privadas, sin una diferencia significativa entre los tipos de anfitrión.

  • Política de cancelación: Esta gráfica es interesante porque muestra que los anfitriones no profesionales tienen una mayor proporción de listados con política flexible, mientras que los anfitriones profesionales predominan en las políticas más estrictas. Esto puede mandar una señal de profesionalismo al consumidor.

Con base en los gráficos anteriores, podemos destacar:

  • Precio y precio por persona: Podemos observar que la media de precios de los anfitriones profesionales es mayor a las de los no profesionales, sin embargo el boxplot nos permite ver que existe una gran cantidad de outliers (siguiendo regla intercuantil) Esto podría causar problemas en los estimadores

  • Reviews totales y por mes (proxy de demanda): Podemos observar que la media de reviews de los anfitriones profesionales es mayor a las de los no profesionales, sin embargo el boxplot nos permite ver que existe una gran cantidad de outliers (siguiendo regla intercuantil) Esto podría causar problemas en los estimadores

  • Listados: Por construcción, los anfitriones no profesionales (<2 listados) tienen una media menor. Lo interesante es observar los outliers en los listados ofrecidos por los anfitriones profesionales, llegando hasta un máximo de 78 listados.

  • Antiguedad de listado: No se encuentra una diferencia significativa en la antiguedad del listado medida como días transcurridos desde el registro en la plataforma.

  • Antiguedad del anfitrión: Los anfitriones profesionales tienen en promedio 130.11 días más de antiguedad en la plataforma. Una diferencia pequeña pero significativa.

  • Amenidades: Los anfitriones profesionales tienen en promedio 1.86 amenidades más respecto a los no profesionales. Una diferencia pequeña pero significativa.

  • Calificación global: Las calificaciones promedio para los listados de Airbnb son en general altas (arriba de 9), esto mismo es encontrado por Guttentag et al (2019) y Lorde et al. (2019). Curiosamente, los anfitriones no profesionales tienen una calificación promedio (96.15) mayor que los profesionales (94.97). Esto señala que los anfitriones no profesionales son mejor evaluados y puede ser explicado por la menor cantidad de reservas que reciben sumado a que tienen mayor atención a los detalles de trato al huésped que un anfitrión que administra múltiples propiedades.

## [1] "Listo"
## 2.25 GB